Uni-Logo
Databases and Information Systems
Sie sind hier: Startseite Teaching Lehrangebot Frühere Semester Cloud Computing
 

Cloud Computing

Veranstalter:

Prof. Dr. Georg Lausen, Geb. 051, Raum 01-024

Mitwirkung:

Dr. Fang Wei, Geb. 051, Raum 01-027

Thomas Hornung, Geb. 051, Raum 01-028

Inhalt des Seminars:

Durch das rapide Wachstum der Datenbestände, ist es oftmals nicht mehr möglich große Datenmengen mit bestehender Hardware zu analysieren. Aus diesem Grund nutzen Firmen verstärkt die Möglichkeit, Rechenressourcen on-demand bei sogenannten Cloud-Anbietern zu mieten. Um die Programmierer in diesem anspruchsvollen Umfeld zu unterstützen, gibt es Frameworks, die dem Programmierer eine abstrakte Sicht auf diese verteilte Umgebung bieten, so dass der Hauptfokus auf der Umsetzung des Analyse-Algorithmus gelegt werden kann.
In diesem Seminar werden aktuelle Forschungstrends zum Thema Verteilte Programmierung in der Cloud und deren Anwendungen behandelt.

Anmeldung:

Wir bitten alle Teilnehmer, sich über das HIS-LSF zur Veranstaltung anzumelden.

Organisatorisches

Die Themenvergabe für angemeldete StudentInnen findet bei der Vorbesprechung am

Mi., den 21. April 2010

statt.
  • ECTS: 4
  • Ort: SR 01-016 Geb. 101
  • Sprache: deutsch/englisch
  • Zeit: Mittwoch, 14:00 - 16:00 c.t. (wöchentlich)

Voraussetzungen für Scheinvergabe

  • Anwesenheit in allen Vorträgen
  • Abgabe der schriftlichen Ausarbeitung bis spätestens zum 24. Juli 2010
  • Ca. 45min Präsentation (wahlweise auf Deutsch oder Englisch) pro Teilnehmer, davon
    • ca. 35min Vortrag
    • ca. 10min Fragen und Diskussion
  • Vorbereitung von je zwei Fragen zu zwei anderen Vorträgen
  • Sie müssen spätestens eine Woche vor Ihrem Präsentationstermin einen Termin mit Ihrem Betreuer vereinbaren, um Ihre Folien zu diskutieren.
  • Vorbereitete Fragen müssen per E-Mail zwei Tage vor dem entsprechenden Seminartermin Ihrem Betreuer zugesandt werden.
  • Die Note setzt sich dann aus 70% Vortrag und 30% Ausarbeitung zusammen.

Vortragsliste

# Fragen Thema Referenzliteratur Datum des Vortrages Referent Betreuer
1 4, 7 Dryad [IBYBF07] 16/06/2010 Said Lobo Thomas Hornung
2 3, 8 Map-Reduce [DG04] 16/06/2010 Asha Nagendra Thomas Hornung
3 1, 10 Map-Reduce-Merge [YDHS07] 23/06/2010 Sebastian Wagner Fang Wei
4 5, 9 Joins in Map-Reduce [AU10] 21/07/2010 Mirza Ahtasham Ahmad Fang Wei
5 2, 6 Sawzall [PDGQ05] 30/06/2010 Jan Kelch Fang Wei
6 7, 9 Pig Latin [ORSKT08] 30/06/2010 Alibek Kulzhabayev Fang Wei
7 3, 5 Distributed Reasoning [UKOvH09] 07/07/2010 Christian Rost Thomas Hornung
8 2, 11 Analysis of Evolutionary Trees [MW10] 21/07/2010 Jürgen Werner Thomas Hornung
9 1, 11 HadoopDB [ABASR09] 14/07/2010 Pedro Vargas Thomas Hornung
10 4, 6 SQL/MapReduce [FPC09] 14/07/2010 Raphael Winkler Thomas Hornung
11 8, 10 Stateful Bulk Processing [LORWY10] 30/06/2010,
14/07/2010 (short)
Michael Leukert Fang Wei

Referenzen

Key Paper
[ABASR09] Azza Abouzeid, Kamil Bajda-Pawlikowski, Daniel Abadi, Avi Silberschatz, and Alex Rasin
HadoopDB: An Architectural Hybrid of MapReduce and DBMS Technologies for Analytical Workloads.
International Conference on Very Large Databases (VLDB), Lyon, France, August 24-28, 2009
[AU10] Foto N. Afrati and Jeffrey D. Ullman
Optimizing Joins in a Map-Reduce Environment.
International Conference on Extending Database Technology (EDBT), Lausanne, Switzerland, March 22-26, 2010
[DG04] Jeffrey Dean and Sanjay Ghemawat:
MapReduce: Simplified Data Processing on Large Clusters.
Symposium on Operating System Design and Implementation (OSDI), San Francisco, CA, U.S.A., December 6-8, 2004.
[FPC09] Eric Friedman, Peter Pawlowski, and John Cieslewicz:
SQL/MapReduce: a Practical Approach to Self-describing, Polymorphic, and Parallelizable User-defined Functions.
International Conference on Very Large Databases (VLDB), Lyon, France, August 24-28, 2009
[IBYBF07] Michael Isard, Mihai Budiu, Yuan Yu, Andrew Birrell, and Dennis Fetterly:
Dryad: Distributed Data-Parallel Programs from Sequential Building Blocks.
European Conference on Computer Systems (EuroSys), Lisbon, Portugal, March 21-23, 2007
[JVB08] Chao Jin, Christian Vecchiola, and Rajkumar Buyya:
MRPGA: An Extension of MapReduce for Parallelizing Genetic Algorithms.
International Conference on e-Science (e-science), Indianapolis, IN, USA, December 10-12, 2008
[LORWY10] Dionysios Logothetis, Christopher Olston, Benjamin Reed, Kevin C. Webb, Ken Yocum:
Stateful Bulk Processing for Incremental Analytics.
ACM Symposium on Cloud Computing (SoCC), Indianapolis, IN, USA, June 10-11, 2010
[MW10] Suzanne Matthews and Tiffani Williams:
MrsRF: an Efficient MapReduce Algorithm for Analyzing Large Collections of Evolutionary Trees.
Asia-Pacific Bioinformatics Conference (APBC), Bangalore, India, January 18-21, 2010
[ORSKT08] Christopher Olston, Benjamin Reed, Utkarsh Srivastava, Ravi Kumar, and Andrew Tomkins:
Pig Latin: a Not-so-foreign Language for Data Processing.
International Conference on Management of Data (SIGMOD), Vancouver, Canada, June 9-12, 2008
[PDGQ05] Rob Pike, Sean Dorward, Robert Griesemer, and Sean Quinlan:
Interpreting the Data: Parallel Analysis with Sawzall.
Scientific Programming, Volume 13, Issue 4 (October 2005), pp. 277-298
[UKOvH09] Jacopo Urbani, Spyros Kotoulas, Eyal Oren, and Frank van Harmelen:
Scalable Distributed Reasoning using MapReduce.
International Semantic Web Conference (ISWC), Washington, D.C., U.S.A., October 25-29, 2009
[YDHS07] Hung-chih Yang, Ali Dasdan, Ruey-Lung Hsiao, and Douglas Stott Parker Jr.:
Map-Reduce-Merge: Simplified Relational Data Processing on Large Clusters.
International Conference on Management of Data (SIGMOD), Beijing, China, June 12-14, 2007